روشی برای بهبود یادگیری ماشینی که با الهام از رفتار نوزادان انسانی انجام می شود
بروزترین
در این وبلاگ سعی میکنیم که بهترین مطالب را ترجمه و در اختیار عموم قرار بدیم

از سال های نخست زندگی خود ، انسان توانایی ذاتی یادگیری مداوم و ساختن الگوهای ذهنی جهان را دارد ، صرفاً با مشاهده و تعامل با چیزها یا افراد اطراف خود. مطالعات روانشناسی شناختی نشان می دهد كه انسان از این دانش قبلاً به دست آمده ، بخصوص هنگام مواجهه با موقعیت های جدید یا هنگام تصمیم گیری ، استفاده گسترده ای می كند.


با وجود پیشرفت های چشمگیر اخیر در زمینه هوش مصنوعی (AI) ، بسیاری از عوامل مجازی هنوز هم برای دستیابی به عملکرد در سطح بشر در چندین کار ، صدها ساعت آموزش لازم دارند ، در حالی که انسان می تواند نحوه انجام این کارها را در چند ساعت یا کمتر یاد بگیرد. . مطالعات اخیر دو عامل مهم در توانایی انسان در دستیابی به دانش را به سرعت برجسته کرده است - یعنی فیزیک بصری و روانشناسی شهودی.

این مدل های شهودی ، که از مراحل اولیه رشد در انسان مشاهده شده اند ، ممکن است اصلی ترین عامل یادگیری آینده باشند. براساس این ایده ، محققان موسسه علوم و فناوری پیشرفته کره (KAIST) اخیراً روشی عادی سازی پاداش ذاتی را تهیه کرده اند که به عوامل هوش مصنوعی اجازه می دهد اقداماتی را انتخاب کنند که بیشترین مدل های شهودی آنها را بهبود می بخشد. محققان در مقاله خود ، که قبلاً در سایت arXiv منتشر شده است ، بطور خاص یک شبکه فیزیک گرافیکی را که با یادگیری تقویت عمیق با الهام از رفتار یادگیری مشاهده شده در نوزادان انسانی ایجاد شده ، پیشنهاد داده است.

محققان در مقاله خود توضیح می دهند: "نوزادان انسانی را در اتاقی با اسباب بازی هایی که در فاصله دور از دسترس قرار دارند تصور کنید." وی ادامه داد: "آنها دائماً در حال گرفتن ، پرتاب و انجام اعمال بر روی اشیاء هستند ؛ بعضی اوقات ، عواقب اعمال خود را مشاهده می کنند ، اما گاهی اوقات ، آنها علاقه خود را از دست می دهند و به سمت یک شی دیگر حرکت می کنند ." دیدگاه کودک به عنوان یک دانشمند نشان می دهد که نوزادان انسان هستند. با انگیزه ذاتی برای انجام آزمایشات خود ، کشف اطلاعات بیشتر و در نهایت یادگیری تمایز اشیاء مختلف و ایجاد بازنمایی داخلی غنی تر از آنها. "

مطالعات روانشناسی نشان می دهد که انسانها در سالهای اول زندگی خود به طور مداوم در حال آزمایش با محیط اطراف خود هستند و این به آنها امکان می دهد تا درک کلیدی از جهان داشته باشند. علاوه بر این ، هنگامی که کودکان نتیجه هایی را که انتظارات قبلی خود را برآورده نمی کنند ، مشاهده می کنند ، که به عنوان نقض انتظار شناخته می شود ، اغلب برای دستیابی به درک بهتر از وضعیتی که در آن قرار دارند ، ترغیب می شوند که بیشتر آزمایش کنند.

تیم محققان KAIST سعی کردند با استفاده از یک رویکرد یادگیری تقویت کننده ، این رفتارها را در عوامل هوش مصنوعی تولید مثل کنند. در مطالعه خود ، آنها ابتدا یک شبکه فیزیک گرافیکی را معرفی کردند که می تواند روابط فیزیکی بین اشیاء را استخراج کرده و رفتارهای بعدی آنها را در یک محیط 3 بعدی پیش بینی کند. پس از آن ، آنها این شبکه را با یک مدل یادگیری تقویت عمیق ادغام کردند و یک تکنیک عادی سازی پاداش ذاتی را معرفی کردند که یک عامل هوش مصنوعی را ترغیب به کشف و شناسایی اقداماتی می کند که به طور مداوم مدل شهودی آن را بهبود می بخشد.

محققان با استفاده از یک موتور فیزیک 3 بعدی ، نشان دادند که شبکه فیزیک گرافیکی آنها می تواند به طور موثری موقعیت ها و سرعت اجسام مختلف را استنباط کند. آنها همچنین دریافتند که رویکرد آنها به شبکه یادگیری تقویتی عمیق اجازه می دهد تا به طور مداوم مدل شهودی خود را بهبود ببخشد و آن را ترغیب به تعامل با اشیاء صرفاً بر اساس انگیزه ذاتی کند.

در یک سری ارزیابی ها ، تکنیک جدید ابداع شده توسط این تیم از محققان با دقت قابل ملاحظه ای روبرو شده است ، به طوری که عامل هوش مصنوعی تعداد بیشتری از اقدامات اکتشافی مختلف را انجام می دهد. در آینده ، این می تواند توسعه ابزارهای یادگیری ماشینی را که می توانند از تجربیات گذشته خود سریعتر و مؤثرتر یاد بگیرند آگاه سازند.

محققان در مقاله خود توضیح می دهند: "ما شبکه خود را بر روی هر دو حالت ثابت و غیر ثابت در صحنه های مختلف با اشیاء کروی با جرم و شعاع مختلف آزمایش کرده ایم." "امید ما این است که این مدلهای شهودی از قبل آموزش دیده بعداً به عنوان دانش قبلی برای سایر کارهای هدف گرا مانند بازی های ATARI یا پیش بینی فیلم استفاده شوند."

مطلب پیشنهادی: روند توسعه پمپ وکیوم خلاء پیچ



نظرات شما عزیزان:

نام :
آدرس ایمیل:
وب سایت/بلاگ :
متن پیام:
:) :( ;) :D
;)) :X :? :P
:* =(( :O };-
:B /:) =DD :S
-) :-(( :-| :-))
نظر خصوصی

 کد را وارد نمایید:

 

 

 

عکس شما

آپلود عکس دلخواه:








تاریخ: چهار شنبه 7 خرداد 1399برچسب:,
ارسال توسط managesit
آخرین مطالب

آرشیو مطالب
پيوند هاي روزانه
امکانات جانبی
ورود اعضا:

نام :
وب :
پیام :
2+2=:
(Refresh)

خبرنامه وب سایت: